智能论文笔记

Analysis of the Effect of Time Delay for Unmanned Aerial Vehicles with Applications to Vision Based Navigation

Muhammad Ahmed Humais , Mohamad Chehadeh , Igor Boiko , Yahya Zweiri

分类：机器人

2022-09-05

在本文中，我们分析了具有基于视觉导航的无人机（UAV）的时间延迟动力学对控制器设计的影响。时间延迟是网络物理系统中不可避免的现象，并且对无人机的控制器设计和轨迹产生具有重要意义。时间延迟对无人机动态的影响随着基于视力较慢的导航堆栈的使用而增加。我们表明，文献中的现有模型不包括时间延迟，不适合控制器调整，因为一个微不足道的解决方案始终存在错误的解决方案。我们确定的微不足道的解决方案表明，使用无限控制器的利益来实现最佳性能，这与实际发现相矛盾。我们通过引入无人机的新型非线性时间延迟模型来避免这种缺点，然后获得与每个UAV控制回路相对应的一组线性解耦模型。分析了角度和高度动力学的线性时间延迟模型的成本函数，与无延迟模型相反，我们显示了有限的最佳控制器参数的存在。由于使用了时间延迟模型，我们在实验上表明，所提出的模型准确地表示系统稳定性限制。由于时间延迟的考虑，我们使用基于视觉探视的无人机（VO）导航，在跟踪峰值速度为2.09 m/s的lemsistate轨迹时，我们实现了RMSE 5.01 cm的跟踪结果，这与最新-艺术。

translated by 谷歌翻译

Static Hovering Realization for Multirotor Aerial Vehicles with Tiltable Propellers

Mahmoud Hamandi , Lakmal Seneviratne , Yahya Zweiri

分类：机器人

2022-07-22

本文介绍了一项关于多连杆航空车（MRAV）与可倾斜螺旋桨在不同方向上实现和维持静态盘旋的能力的理论研究。为了分析具有可倾斜螺旋桨实现静态盘旋的MRAV的能力，引入了平台控制输入和应用力和矩之间的新型线性图。引入地图与平台在不同方向上悬停的能力之间的关系。相应地，详细介绍了具有可倾斜螺旋桨的MRAV来实现和维持静态盘旋的条件。然后引入了数值指标，这反映了MRAV在不同方向上维持静态盘旋的能力。带有可倾斜螺旋桨的MRAV的子类定义为静态悬停的平台（CSH），其中CSH平台是MRAV，无法维持与固定螺旋桨悬停的静态悬停，但可以通过倾斜螺旋桨实现静态悬停。最后，进行了广泛的仿真来测试和验证上述发现，并证明所提出的数值指标对平台动力学的影响。

translated by 谷歌翻译

Design of Dynamics Invariant LSTM for Touch Based Human-UAV Interaction Detection

Anees Peringal , Mohamad Chehadeh , Rana Azzam , Mahmoud Hamandi , Igor Boiko , Yahya Zweiri

分类：机器人

2022-07-12

在过去的几年中，无人驾驶汽车（UAV）的领域已经达到了高水平的成熟度。因此，将此类平台从封闭的实验室带到与人类的日常互动对于无人机的商业化很重要。本文的一种特殊人类企业感兴趣的方案是有效载荷切换计划，无人机应要求人将有效载荷移交给人类的有效载荷。在此范围内，本文提出了一种新型的实时人类UAV相互作用检测方法，其中开发了基于短期记忆（LSTM）的神经网络，以检测由人类相互作用动态导致的状态概况。提出了一种新的数据预处理技术；该技术利用培训和测试无人机的估计过程参数来构建动态不变测试数据。提出的检测算法是轻量级的，因此可以使用Off Shelf UAV平台实时部署；此外，它仅取决于任何经典无人机平台上存在的惯性和位置测量。提出的方法是在多电动无人机和人类之间的有效载荷切换任务上证明的。使用实时实验收集培训和测试数据。检测方法的准确性为96 \％，即使存在外部风干扰，也没有误报，并且在两种不同的无人机上进行部署和测试时。

translated by 谷歌翻译

A Neuromorphic Vision-Based Measurement for Robust Relative Localization in Future Space Exploration Missions

Mohammed Salah , Mohammed Chehadah , Muhammed Humais , Mohammed Wahbah , Abdulla Ayyad , Rana Azzam , Lakmal Senevirante , Yahya Zweiri

分类：计算机视觉

2022-06-23

太空探索目睹了毅力漫游者登陆火星表面，并展示了火星直升机超越地球以外的第一次飞行。在他们在火星上的任务中，毅力漫游者和Ingenuity合作探索了火星表面，Ingenuity侦察员地形信息为Rover的安全穿越。因此，确定两个平台之间的相对姿势对于此任务的成功至关重要。在这种必要性的驱动下，这项工作提出了基于基于神经形态视觉测量（NVBM）和惯性测量的融合的强大相对定位系统。神经形态视觉的出现引发了计算机视觉社区的范式转变，这是由于其独特的工作原理由现场发生的光强度变化触发的异步事件所划定。这意味着由于照明不变性而无法在静态场景中获取观察结果。为了规避这一限制，在场景中插入了高频活动地标，以确保一致的事件射击。这些地标被用作促进相对定位的显着特征。开发了一种新型的基于事件的地标识别算法，使用高斯混合模型（GMM），用于匹配我们NVBM的地标对应。 NVBM与提议的状态估计器中的惯性测量，地标跟踪Kalman滤波器（LTKF）和翻译解耦的Kalman Filter（TDKF）分别用于地标跟踪和相对定位。该系统在各种实验中进行了测试，并且在准确性和范围方面具有优于最先进的方法。

translated by 谷歌翻译

Neuromorphic Vision Based Control for the Precise Positioning of Robotic Drilling Systems

Abdulla Ayyad , Mohamad Halwani , Dewald Swart , Rajkumar Muthusamy , Fahad Almaskari , Yahya Zweiri

分类：机器人

2022-01-05

该制造业目前目前目睹了与工业机器人前所未有的采用的范式转变，机器愿景是一种关键的感知技术，使这些机器人能够在非结构化环境中进行精确的操作。然而，传统视觉传感器对照明条件和高速运动的灵敏度为生产线的可靠性和工作速率设定了限制。神经形态视觉是最近的技术，有可能解决传统视觉的挑战，其具有高颞率，低延迟和宽动态范围。在本文中，我们首次提出了一种新型神经形态视觉的基于峰值的控制器，用于更快，更可靠的加工操作，并具有能够进行具有亚毫米精度的钻井任务的完整机器人系统。我们所提出的系统使用我们专为神经形态摄像机的异步输出开发的两种感知阶段为3D定位了目标工件。第一阶段执行用于初始估计工件的姿势的多视图重建，并且第二阶段使用圆孔检测对工件的局部区域进行这种估计。然后，机器人精确地定位钻孔末端执行器并使用基于组合的位置和基于图像的视觉伺服方法钻取工件上的目标孔。所提出的解决方案是通过实验验证的用于在具有不受控制的照明的非结构环境中任意地放置的工件上的工件上钻出螺母孔。实验结果证明了我们的溶液的有效性小于0.1mm的平均位置误差，并证明了神经形态视觉的使用克服了传统相机的照明和速度限制。

translated by 谷歌翻译

Neuromorphic Camera Denoising using Graph Neural Network-driven Transformers

Yusra Alkendi , Rana Azzam , Abdulla Ayyad , Sajid Javed , Lakmal Seneviratne , Yahya Zweiri

分类：计算机视觉 | 机器人

2021-12-17

神经形态的愿景是一种生物启发技术，它已经引发了计算机视觉界的范式转变，并作为众多应用的关键推动器。该技术提供了显着的优势，包括降低功耗，降低处理需求和通信加速。然而，神经形态摄像机患有大量的测量噪声。这种噪声恶化了基于神经形态事件的感知和导航算法的性能。在本文中，我们提出了一种新的噪声过滤算法来消除不代表观察场景中的实际记录强度变化的事件。我们采用图形神经网络（GNN） - 驱动的变压器算法，称为GNN变换器，将原始流中的每个活动事件像素分类为实木强度变化或噪声。在GNN中，传递一个名为EventConv的消息传递框架，以反映事件之间的时空相关性，同时保留它们的异步性质。我们还介绍了在各种照明条件下生成事件流的近似地面真理标签（KogT1）方法。 Kogtl用于生成标记的数据集，从记录在充满挑战的照明条件下进行的实验。这些数据集用于培训和广泛测试我们所提出的算法。在取消检测的数据集上测试时，所提出的算法在过滤精度方面优于现有方法12％。还对公共数据集进行了额外的测试，以展示在存在照明变化和不同运动动态的情况下所提出的算法的泛化能力。与现有解决方案相比，定性结果验证了所提出的算法的卓越能力，以消除噪音，同时保留有意义的场景事件。

translated by 谷歌翻译

PMODE: Prototypical Mask based Object Dimension Estimation

Thariq Khalid , Mohammed Yahya Hakami , Riad Souissi

分类：计算机视觉

2022-12-26

Can a neural network estimate an object's dimension in the wild? In this paper, we propose a method and deep learning architecture to estimate the dimensions of a quadrilateral object of interest in videos using a monocular camera. The proposed technique does not use camera calibration or handcrafted geometric features; however, features are learned with the help of coefficients of a segmentation neural network during the training process. A real-time instance segmentation-based Deep Neural Network with a ResNet50 backbone is employed, giving the object's prototype mask and thus provides a region of interest to regress its dimensions. The instance segmentation network is trained to look at only the nearest object of interest. The regression is performed using an MLP head which looks only at the mask coefficients of the bounding box detector head and the prototype segmentation mask. We trained the system with three different random cameras achieving 22% MAPE for the test dataset for the dimension estimation

translated by 谷歌翻译

RFID-Cloud Integration for Smart Management of Public Car Parking Spaces

Umar Yahya , Ndawula Noah , Asingwire Hanifah , Lubega Faham , Abdal Kasule , Hamisi Ramadhan Mubarak

分类：人工智能 | 机器人

2022-12-25

Effective management of public shared spaces such as car parking space, is one challenging transformational aspect for many cities, especially in the developing World. By leveraging sensing technologies, cloud computing, and Artificial Intelligence, Cities are increasingly being managed smartly. Smart Cities not only bring convenience to City dwellers, but also improve their quality of life as advocated for by United Nations in the 2030 Sustainable Development Goal on Sustainable Cities and Communities. Through integration of Internet of Things and Cloud Computing, this paper presents a successful proof-of-concept implementation of a framework for managing public car parking spaces. Reservation of parking slots is done through a cloud-hosted application, while access to and out of the parking slot is enabled through Radio Frequency Identification (RFID) technology which in real-time, accordingly triggers update of the parking slot availability in the cloud-hosted database. This framework could bring considerable convenience to City dwellers since motorists only have to drive to a parking space when sure of a vacant parking slot, an important stride towards realization of sustainable smart cities and communities.

translated by 谷歌翻译

IoT-Based Pothole Mapping Agent with Remote Visualization

Umar Yahya , Mwaka Lucky , Muhammed Mansoor , Nankabirwa Sharifah , Abdal Kasule , Kasagga Usama

分类：机器人

2022-12-25

Driving through pothole infested roads is a life hazard and economically costly. The experience is even worse for motorists using the pothole filled road for the first time. Pothole-filled road networks have been associated with severe traffic jam especially during peak times of the day. Besides not being fuel consumption friendly and being time wasting, traffic jams often lead to increased carbon emissions as well as noise pollution. Moreover, the risk of fatal accidents has also been strongly associated with potholes among other road network factors. Discovering potholes prior to using a particular road is therefore of significant importance. This work presents a successful demonstration of sensor-based pothole mapping agent that captures both the pothole's depth as well as its location coordinates, parameters that are then used to generate a pothole map for the agent's entire journey. The map can thus be shared with all motorists intending to use the same route.

translated by 谷歌翻译

Generalisability of deep learning models in low-resource imaging settings: A fetal ultrasound study in 5 African countries

Carla Sendra-Balcells , Víctor M. Campello , Jordina Torrents-Barrena , Yahya Ali Ahmed , Mustafa Elattar , Benard Ohene Botwe , Pempho Nyangulu , William Stones , Mohammed Ammar , Lamya Nawal Benamer

分类：计算机视觉

2022-09-20

大多数人工智能（AI）研究都集中在高收入国家，其中成像数据，IT基础设施和临床专业知识丰富。但是，在需要医学成像的有限资源环境中取得了较慢的进步。例如，在撒哈拉以南非洲，由于获得产前筛查的机会有限，围产期死亡率的率很高。在这些国家，可以实施AI模型，以帮助临床医生获得胎儿超声平面以诊断胎儿异常。到目前为止，已经提出了深度学习模型来识别标准的胎儿平面，但是没有证据表明它们能够概括获得高端超声设备和数据的中心。这项工作研究了不同的策略，以减少在高资源临床中心训练并转移到新的低资源中心的胎儿平面分类模型的域转移效果。为此，首先在丹麦的一个新中心对1,008例患者的新中心进行评估，接受了1,008名患者的新中心，后来对五个非洲中心（埃及，阿尔及利亚，乌干达，加纳和马拉维进行了相同的表现），首先在丹麦的一个新中心进行评估。）每个患者有25名。结果表明，转移学习方法可以是将小型非洲样本与发达国家现有的大规模数据库相结合的解决方案。特别是，该模型可以通过将召回率提高到0.92 \ pm 0.04 $，同时又可以维持高精度。该框架显示了在临床中心构建可概括的新AI模型的希望，该模型在具有挑战性和异质条件下获得的数据有限，并呼吁进行进一步的研究，以开发用于资源较少的国家 /地区的AI可用性的新解决方案。

translated by 谷歌翻译